Tarjetas gráficas

Blackwell Arquitectura: Estas son todas las novedades de las RTX 5000

La innovadora arquitectura Blackwell de NVIDIA está dando mucho que hablar. Esta nueva generación de GPUs está estableciendo un nuevo estándar en el rendimiento gráfico y la inteligencia artificial. Esta arquitectura, que impulsa la nueva serie de GeForce RTX 50, introduce avances significativos como la cuarta generación de DLSS, que utiliza IA para mejorar la creación de fotogramas en pantalla, aumentando el rendimiento hasta ocho veces en comparación con el renderizado tradicional. ¿Quieres saber cómo lo consigue?

Especificaciones de las tarjetas gráficas basadas en Blackwell

modelos RTX 5090 RTX 5080 RTX 5070 Ti RTX 5070 RTX 5060 Ti RTX 5060

Chip

GB202

GB203

GB203

GB205

GB207

GB207

Nodo de fabricación

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

TSMC 4N

Recuento de transistores (miles de millones)

92.2

45.6

45.6

31.0

Tamaño del chip (mm2)

750

378

378

263

Streaming Multiprocessors

170

84

70

48

36

24

Shaders (ALUs)

21760

10752

8960

6144

4608

3072

Tensor cores

680

336

280

192

144

96

Ray Tracing Units

170

84

70

48

36

24

Frecuencia de reloj (Mhz)

2407

2617

2452

2512

2500

2500

Velocidad VRAM (Gbps)

28

30

28

28

30

28

Capacidad VRAM (GB)

32

16

16

12

8

8

Ancho de bus VRAM

512

256

256

192

128

128

Memoria caché L2

96

64

48

48

32

24

TFLOPS FP32

104.8

56.3

43.9

30.9

23.0

15.4

TFLOPS FP16 (INT8 TOPS)

838 (3352)

450 (1801)

352 (1406)

247 (988)

199 (737)

133 (492)

Ancho de banda (GB/s)

1792

960

896

672

480

448

TBP (vatios)

575

360

300

250

200

150

También te recomiendo leer nuestro artículo sobre las mejores tarjetas gráficas del mercado

Un poco de historia sobre NVIDIA Blackwell

blackwell

Blackwell, rinde homenaje al matemático afroamericano David Harold Blackwell, reconocido por sus aportes en teoría de juegos, probabilidad, teoría de la información y estadística. Estos campos han influido directamente en el desarrollo de modelos de IA generativa basados en transformadores y sus algoritmos de entrenamiento. Blackwell también fue el primer académico de color en ser admitido en la Academia Nacional de Ciencias de EE. UU.

NVIDIA lleva tiempo usando epónimos (nombres de personajes históricos ilustres para los nombres clave de sus arquitecturas). Estos epónimos son Ada Lovelace, Ampere, Hopper, Tesla, Maxwell, Turing, Volta, etc., o la arquitectura Rubin, por Vera Rubin, que llegará dentro de unos años…

En 2024, NVIDIA ya anunció que las futuras tarjetas gráficas para consumo estarían basadas en esta arquitectura Blackwell, además de sus aceleradores B100, B200 y otros productos para distintos sectores de mercado. Esta nueva arquitectura viene diseñada con la IA muy presente, tanto a nivel de hardware como a nivel de software, apoyándose sobre esta tecnología para conseguir mayor rendimiento, eficiencia y mejoras en el gaming, así como potenciar las nuevas aplicaciones de IA generativas para creadores.

En octubre de 2024 llegaron malas noticias para Blackwell, ya que se filtró a los medios que la arquitectura presentaba un defecto de diseño que NVIDIA solucionó en colaboración con TSMC, para así permitir la fabricación de estos chips sin problema bajo el nodo de 4NM, y sin alterar las previsiones de la compañía Graphzilla. Según Jensen Huang, CEO de la compañía verde, este problema era funcional, y solo afectaba al yield, es decir, a la cantidad de chips válidos por wafer, ya que parece que el problema reducía la cantidad de chips funcionales en cada oblea de silicio.

No obstante, Blackwell sigue con algunos problemas, en este caso no técnicos, sino de suministro, ya que debido a la demanda de chips para IA, NVIDIA ha reconocido que no podrá abastecer a tiempo toda la demanda de chips…

Te recomiendo leer nuestra guía sobre la mejor configuración gaming

Detalles técnicos de la arquitectura Blackwell

blackwell mejoras

Blackwell es una arquitectura diseñada tanto para aplicaciones de cómputo en centros de datos como para juegos y estaciones de trabajo, una unificación de ambos productos como también hará AMD con su UDNA, que unifica RDNA y CDNA. Los chips GPU Blackwell se fabrican en el nodo personalizado TSMC 4NP, una evolución del nodo 4N utilizado en las arquitecturas Hopper y Ada Lovelace. Este proceso mejora la eficiencia energética y el rendimiento sin un cambio significativo en la tecnología de fabricación en cuanto a tamaño de transistores.

El GB100, orientado a centros de datos, cuenta con 104 mil millones de transistores, un aumento del 30% respecto al GH100 de Hopper. Para superar las limitaciones del tamaño del chip, Nvidia ha fusionado dos chips GB100 en un solo empaquetado, conectados mediante la interfaz o interposer NV-HBI (High Bandwidth Interface) con un ancho de banda de 10 TB/s. Para el mercado de consumo, el mayor chip de Blackwell, el GB202 (RTX 5090), tiene 750 mm² y 24,576 núcleos CUDA, un 28.5% más que el AD102 de Ada Lovelace.

Unidades de procesamiento

Aunque Blackwell comparte algunos detalles técnicos con la anterior generación, dado que es una evolución, también se han introducido cambios y novedades en las unidades de procesamiento, de ahí las mejoras en el rendimiento de estos nuevos chips. Estas mejoras clave son:

  • CUDA Compute Capability 10.0 y 12.0.
  • 5ª Generación de Tensor Cores, con soporte para FP4 y FP6 para acelerar aplicaciones IA, aumentando la eficiencia y el rendimiento en inferencia de modelos de IA generativa.
  • 4ª Generación de los núcleos Ray Tracing para geometrías más complejas, mejorando el rendimiento en Ray Tracing, duplicando la tasa de intersección de rayos y triángulos en comparación con Ada Lovelace.
  • Y un batallón de tecnologías novedosas que iremos comentando en otros artículos del blog, como la nueva DLSS 4, RTX AI, y mucho más…

Otra de las mejoras de Blackwell está en la salida de vídeo, con conectores DisplayPort 2.1 UHBR20 capaz de alcanzar los 20 Gbps, un importante paso adelante respecto a la arquitectura anterior. Una alta velocidad que no llega sola, ya que los motores de codificación y decodificación han pasado a ser de 9ª y 6ª generación respectivamente, consiguiendo grandes mejoras en cuanto al tratamiento de vídeo para AV1, H.264, 4 2 2 y MV-HEVC.

codec

Memoria: GDDR7 y caché L2 mejorada

Las GPU Blackwell utiliza memoria GDDR7, proporcionando velocidades de hasta 36 Gbps (con variantes de hasta 40 Gbps en el futuro). La RTX 5090, 5080 y 5070 Ti usan GDDR7 a 28 Gbps, mientras que la RTX 5080 contará con una variante a 30 Gbps. En comparación con la RTX 4090, esto representa un aumento del 33% en ancho de banda.

Además, NVIDIA continuará apostando por una gran caché L2, lo que mejora el rendimiento efectivo de la memoria al reducir accesos innecesarios a la VRAM. Algo que tendrá un impacto positivo en el rendimiento general, y en la cantidad de FPS generada en videojuegos.

gddr7

Eficiencia energética

Una de las cosas que se reumoreaban es que las RTX 50 Series serían enormes y con un consumo preocupante, sin embargo, esto no ha sido así. Tanto los avances en el diseño de Blackwell como el nuevo nodo de fabricación de TSMC han conseguido que la eficiencia y rendiniento por vatio se vean muy beneficiados en esta generación de GPUs.

Además, se ha actuado especialmente en tres frentes para conseguir grandes mejoras respecto a Ada, como:

  • Clock gating, para adaptar la frecuencia de reloj de forma dinámica para consumir solo lo necesario según la carga de trabajo de cada momento.
  • Power gating, para reducir la alimentación siempre que la frecuencia lo permita sin generar inestabilidad, aportando menos voltios y por tanto menos consumo y una temperatura más baja.
  • Rail gating, para reducir el consumo de energía al apagar por completo secciones del chip cuando no están en uso. Es decir, pudiendo apagar los núcleos si no se están usando, manteniendo el estado en memoria.

Por supuesto, todo esto ha conseguido ahorros energéticos de hasta el 50%, que no es nada despreciable. Además, la tecnología de escalado de frecuencia dinámico y de voltaje (DVFS) se ha mejorado para que el cambio de frecuencia sea mucho más rápido, como se aprecia en las imágenes anteriores, mejorando tanto el rendimiento cuando se demanda más frecuencia para cargas pesadas, como también reduciendo el consumo al ajustar la frecuencia a un nivel más bajo cuando no es necesaria.

También me gustaría agregar que las tarjetas RTX 50-series seguirán utilizando el conector 16 pines ATX 12V-2×6, la versión mejorada del criticado 12VHPWR de la RTX 4090. NVIDIA asegura que los problemas térmicos han sido resueltos con esta revisión, así que no debería haber ningún problema al respecto, como se vieron en las primeras RTX 40 Series en su lanzamiento…

Tus comentarios serán bienvenidos…

Isaac

Geek de los sistemas electrónicos, especialmente del hardware informático. Con alma de escritor y pasión por compartir todo el conocimiento sobre tecnología.
Los datos de carácter personal que nos facilite mediante este formulario quedarán registrados en un fichero de Miguel Ángel Navas Carrera, con la finalidad de gestionar los comentarios que realizas en este blog. La legitimación se realiza a través del consentimiento del interesado. Si no se acepta no podrás comentar en este blog. Puedes consultar Política de privacidad. Puede ejercitar los derechos de acceso, rectificación, cancelación y oposición en info@profesionalreview.com
Botón volver arriba